پیش پردازش متون چاپی فارسی برای جداسازی حروف
پایان نامه
چکیده
پردازش مستندات یکی از جذاب ترین زمینه های بازشناسی الگو است و بازشناسی متون، محوری ترین بخش در پردازش مستندات است . یکی از مهمترین مراحل بازشناسی متون چاپی فارسی جداسازی حروف است . ما در این پایان نامه با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی است ، الگوریتم جداسازی مناسبی برای متون چاپی قدیمی ارائه کرده ایم. برای حل مشکل نایکنواختی کرسی خط، روش مناسبی برای تعیین نوار زمینه پیشتهاد کرده ایم و با اصلاح روش برچسب زنی کانتور بالایی و تکمیل قواعد جداسازی، دقت الگوریتم را برای متون قدیمی افزایش داده ایم. نرخ جداسازی درست حروف با استفاده از این الگوریتم برای یک مجموعه آزمایش که از متون قدیمی برگزیده شده است ، بدون هیچ پس پردازشی 97 درصد است . برای جداسازی نقاط چسبیده به بدنه حروف نیز روشی ارائه شده است که نتایج رضایت بخشی داده است .
منابع مشابه
پیش پردازش تصاویر متون فارسی دوربینی برای کاربردهای بازشناسی حروف
در این پایان نامه، روش هایی برای رفع اعوجاجات هندسی درتصاویر متون فارسی دوربینی ارائه می شود. روش های پیشنهادی شامل رفع انحنا، حذف کجی و پرسپکتیو در این تصاویر هستند. اساس کار در این روش ها به این صورت است که پس از مرحله پیش پردازش، ناحیه مربوط به هر خط متن تعیین و با اعمال تبدیل هندسی پرسپکتیو به روی تصویر، اعوجاجات هندسی آن حذف می شود. الگوریتم پیشنهادی اول، انحنا را برای اولین بار در تصاویر ...
15 صفحه اولالگوریتم اصلاح شده جداسازی حروف متون چاپی با برچسب زدن به کانتور بالایی کلمات
در این مقاله با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی کلمات است، الگوریتم جداسازی مناسبی برای متون با کیفیت چاپی پایین ارائه شده است. برای حل مشکل نایکنواختی نوار زمینه خط،روش مناسبی برای تعیین نوار زمینه محلی پیشنهاد شده و با اصلاح روش بر چسب زنی کانتور بالایی وتکمیل قواعد جداسازی، دقت الگوریتم افزایش داده شده است. نرخ جداسازی درست حروف 97% است. بر اساس نتایج به دست آمده، بررسی دقیقی د...
متن کاملجداسازی متون چاپی فارسی و لاتین در اسناد دو زبانه با استفاده از پردازش تصویر سند
امروزه حجم زیادی از اسناد کاغذی موجود، توسط جاروب گر ها یا دوربین ها به اسناد تصویری دیجیتالی تبدیل می شوند. ذخیره سازی، بازیابی و مدیریت کارآمد این شیوه های تصویری، در بسیاری از برنامه ها نظیر اتوماسیون اداری و کتابخانه های دیجیتالی اهمیت فراوانی دارند. برای تبدیل اسناد تصویری به اسناد متنی از سیستم های تشخیص اپتیکی حروف، ocr، استفاده می شود. سیستم های ocr تابع زبان متن بوده و با توجه به زبان ...
15 صفحه اولحروف فارسی و عربی در نخستین کتابهای چاپی فارسی و عربی در جهان
هدف: ارتباطات سیاسی و اقتصادی بین خاورمیانه و غرب در عصر رنسانس، سبب چاپ کتاب به الفبای عربی در اروپا شد. این مقاله به تحول حروف چاپی در نخستین کتابهای چاپ شده به زبانهای فارسی و عربی می پردازد.روش/ رویکرد پژوهش: این مقاله با استفاده از مواد کتابخانهای وآرشیوی نوشته شده است.یافتهها: پیش از شروع چاپ در اروپا با استفاده از حروف متحرک عربی، ابتدا این کتابها بهوسیله قالبهای چوبی چاپ میشد. د...
متن کاملبازشناسی متون چاپی فارسی
برای بازشناسی کلمات سه رویکرد مبتنی بر جداسازی، مبتنی بر بازشناسی کلمه یک الگوی واحد و رویکرد ترکیبی مطرح است . در این رساله یک سیستم برای بازشناسی متون چاپی فارسی با استفاده از رویکرد ترکیبی ارائه شده است . یک الگوریتم جدید برای جداسازی حروف در کلمات چاپی بدون توجه به نوع قلم ارائه شده است . مراحل مختلف الگوریتم شامل تعیین نوار زمینه، تصحیح آن و جداسازی حروف است . در تعیین نوار زمینه روش جدیدی...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023